查看原文
其他

终于,进 字节跳动 了!

The following article is from 数据仓库与Python大数据 Author 花荣


作者:花荣,高级数开,最近在看机会,陆续面试了美团、滴滴、快手、字节等公司。本文将分享面试字节跳动数据仓库开发岗-抖音的面经。


导读:没有几个工程师天赋异禀,技术的差距,是认知的差距。文笔差多包涵,希望对你有用。谢邀!



大家好,我是花荣。


今天主要和大家分享字节跳动-抖音的大数据数仓职位面试经验,希望对大家有用。


因前司[不知名小公司]发生人员动荡,人心惶惶,鄙人也下定决心看看外面的机会,骑驴找马,开启了一波面试。先后面了一些中小型公司,找到感觉后又面试了滴滴、美团、快手、京东、字节等“大厂”。


面试陆续用了差不多一个月,整体感觉下来面多了发现面试差不多也就那些问题。更多时候更是时运的一个碰撞,公司项目恰很缺人或和面试官对上眼缘基本能成。


单说面试字节,前前后后,历经5面(4轮技术+HR面),历时20天,终于拿下offer。感觉整个人都自信了,职级和薪酬都很满意,奥利给!





一面:



   00. 自我介绍

   01. 数仓痛点?为什么要做3.0?数仓3.0流程是怎样的?

   02. 数据倾斜,大表join大表,如何解决有哪几种方式?

   03. 数仓分工?如何迭代3.0进度,对接需求?

   04. 数据质量如何保证?指标一致性如何保证?

   05. 用到哪些计算组件,分别有什么异同?

   06. ods全量,增量如何确定?有哪些衡量点?

   07. 两道sql题,粉丝互相关注,波峰波谷

   08. 一道算法题,链表反转o(1)

   09. 数仓模型优化手段及方式、规范与规划

   10. 数据中台的理解,极致的数仓分层?


时间:此面试为约后第二天晚上8点(字节一般都是晚上)感受:字节一面还是比较专业,他们知道要招什么样子的人,就会问相关的知识。ps:如果碰到大数据开发出身的面试官面试就贼难受0.0,尤其是在思想和思考问题的范式上差异明显。


        



二面:



   01. MR如何自定义partition,原理讲一下

   02. 数仓模型,如何是最优的?怎么衡量的?

   03. 遇到的业务夸N天,如何解决的?你们公司的场景,模型怎么设计?

   04. RDD特性

   05. spark的运行机制,job,stage,task划分

   06. spark shuffle 与 mr shuffle 不同

   07. 一道sql题,行转列,

   08. 一道算法题,2分查找o(0)

   09. 结合项目+业务场景各种灵魂拷问,深层次追问

   10. 数据治理方案、实施、权责、收益与风险点


时间:此面试为一面后第二天上午11点。

感受:二面就会从3个方向问,数仓专业知识(理论+实际场景),大数据组件,以及各种语言的摸底。

把内裤都扒出来了,最后还会问有哪些你擅长我没有问到的,就是要知道你的擅长点,好给你安排工作。




三面: 



   01. 主要负责哪些?会一步一步追询问

   02. order by sort by 区别 ,底层原理是什么?

   03. 有哪些计算引擎,你们工作中如何选取与运用?

   04. presto 与 spark 区别,多方面讲解

   05. 项目中有遇到复杂的场景是什么?怎么处理的?你觉得好吗?还有一次机会你会怎么处理?

   06. 觉得主要擅长哪些?举例两点?

   07. 主题是如何划分的?具体case

   08. 抖音中如何确定学生群里用户?

   09. 如何确定分区数?

   10. 一道sql,千亿级uv计算

   11.一道算法归并排序o(1)


时间:此面试为二面后第三天上午11点。

感受:三面就技术+架构+职责都会问一下,面上的东西也会结合实际的工作场景。





四面:



   01. hdfs了解吗?整体讲一下,block的大小是多少?哪个版本?之前的是多少?用哪个参数控制?

   02. 为什么block设置为128mb,之前为什么是它size一半,为什么不调大

   03. 数仓主要做哪些事情,你的主要推进了什么?

   04. dwd、dws 的英文是啥?各层都做了哪些事情?   

   05. MR阶段的kvbuffer缓冲区了解吗?它的价值体现在哪里?

   06. sql如何转化为MR,整体流程讲一下

   07. sql提交yarn的流程

   08. 如何控制map个数

   09. 写一道sql,性能最优,为什么最优,有几个job,几个mr,如果我想降低job,mr数量,怎么写

   10. 讲一个你比较擅长的,把我讲通


时间:此面试为三面后第三天上午11点。

感受:这个等于前面的人面过的再问问,这面是交叉面试,所以会都问问,如果能达个大概都没有问题。要态度好点。





五面:



HR面,聊下三观、谈下理想与职业规划等;然后就是最重头戏了:谈薪酬。以前没待过大厂,所以对职级和薪资没有很好地了解,建议也可以看看这篇文章:大厂职级与薪资,以防要低了后面后悔。到了这一面了,属于自己的该争取的还是要奋力争取的。




 整体总结


首先面试这么多家、这么多场,字节的数仓面的是最全最细致的,态度是最好的,引导式问体感很nice。


其次,就是专业度,字节的人有一说一确实都很专业,至少面试官,没有那种水平一般都很强。


然后就是个人了,没说的,干数仓要精通,知其所以然很重要,其次要技术栈丰富一些,不能仅仅停留在数仓。


最后本人是面试抖音,面试也要看专业是否对口,然后眼缘运气也会占一定程度,最后祝大家面面过,家家斩offer。希望以后有机会大家做同事。




致敬:吃水不忘挖井人,面试期间认真研读了前辈们的文章,受益匪浅、学到很多。鸣谢蚂蚁金服的潇傲江湖,字节头条的小萝卜算子,美团面经的臭豆腐,给予面试指导的空空,感恩!也再次感谢紫霞的约稿,谢邀!


♥潇傲江湖:蚂蚁金服-数仓高级面试
♥小萝卜:头条 | 大厂数据开发面试经验
♥臭豆腐:美团-数据仓库高级工程师面试
♥空空:大数据产品平台化体系.xmind

☞ 分析两分钟,跑数两小时?这份SQL优化大全建议收藏

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存